मुंबई, 11 दिसंबर, (न्यूज़ हेल्पलाइन) बुधवार को, Google ने जेमिनी एआई नामक अपने सबसे शक्तिशाली मल्टीमॉडल मॉडल का अनावरण किया। नए बड़े भाषा मॉडल या एलएलएम को एक वीडियो में प्रदर्शित किया गया था जिसे Google और कंपनी के मालिक सुंदर पिचाई द्वारा साझा किया गया था। कम से कम कहें तो हमें डेमो अजीब लगा। डेमो वीडियो में दिखाया गया है कि कैसे आपके हाथ में एक रबर बत्तख पकड़कर, जेमिनी एआई आपको एक गेम का अंदाजा दे सकता है या आपको बता सकता है कि विभिन्न भाषाओं में बत्तख को क्या कहा जाता है। और यह सिर्फ नतीजे नहीं हैं, बल्कि डेमो में जो बात हैरान करने वाली है वह यह है कि जेमिनी एआई किस तरह से बातचीत करता है और जिस गति से यह समझता है कि मानव क्या कर रहा है और वास्तविक समय में जानकारी को अपडेट और जोड़ता रहता है। लेकिन, पता चला कि जो डेमो वीडियो हमने देखा, वह बिल्कुल वास्तविक नहीं है!
जाहिरा तौर पर, डेमो वीडियो को केवल आउटपुट गति बढ़ाने के लिए संपादित नहीं किया गया था - जो कि निष्पक्ष रूप से, वीडियो विवरण में उल्लिखित है - जैसा कि वीडियो दिखाता है, उसके विपरीत, वास्तव में मानव उपयोगकर्ता और एआई के बीच कोई ध्वनि संपर्क नहीं था . ब्लूमबर्ग के एक हालिया लेख में इसका खुलासा हुआ है और Google ने भी ये संपादन करने की बात स्वीकार की है।
वास्तव में, लाइव प्रदर्शन फ़ुटेज से स्थिर छवि फ़्रेमों का उपयोग करके और पाठ के माध्यम से निर्देश देकर बनाया गया था, बजाय इसके कि जेमिनी वास्तविक समय के चित्रों या मेज पर वस्तुओं में परिवर्तन का जवाब दे, या भविष्यवाणी कर सके। जो अब वीडियो को इतना कमज़ोर बना देता है। अब यह भी चिंता का विषय है कि उचित अस्वीकरण नहीं थे और वीडियो वास्तव में दर्शकों को गुमराह करता है। इससे यह भी संदेह पैदा होता है कि जेमिनी एआई सार्वजनिक उपयोग के लिए कितना तैयार है।
Google में जेमिनी के सह-प्रमुख, ओरिओल विन्याल्स ने एक्स पर एक पोस्ट में कहा, “वीडियो में सभी उपयोगकर्ता संकेत और आउटपुट वास्तविक हैं, संक्षिप्तता के लिए संक्षिप्त किए गए हैं। वीडियो दिखाता है कि जेमिनी के साथ निर्मित मल्टीमॉडल उपयोगकर्ता अनुभव कैसा दिख सकता है। हमने इसे डेवलपर्स को प्रेरित करने के लिए बनाया है।" ऐसा लगता है कि उस कथन में रचनात्मक स्वतंत्रता का अंतर्निहित स्वर है।
इस पर एक उपयोगकर्ता, @BenedictSlaney ने सही प्रतिक्रिया देते हुए कहा, “यदि आप डेवलपर्स को प्रेरित करना चाहते हैं तो आप तथ्यात्मक सामग्री पोस्ट क्यों नहीं करते? संकेत "वास्तविक" नहीं हो सकते और एक ही समय में छोटे नहीं हो सकते। यह कपटपूर्ण और भ्रामक था।”
यह जेमिनी एआई डेमो वीडियो गड़बड़ी Google I/O 2018 में Google डुप्लेक्स डेमो का तत्काल अनुस्मारक है। क्या आपको सुंदर पिचाई को सैलून और रेस्तरां में आरक्षण करने के लिए एआई वॉयस असिस्टेंट का डेमो देना याद है? यह उतना ही अजीब था और यह कितना सहज था, इसके कारण इसे संपादित किए जाने पर भी संदेह पैदा हो गया था। I/O इवेंट के कुछ दिनों बाद यह पाया गया कि डुप्लेक्स डेमो लाइव फ़ोन कॉल होने के बजाय पहले से रिकॉर्ड किया गया था। हालाँकि, पिचाई ने कॉलों को "वास्तविक" बताया, जिसका अर्थ है कि Google प्रतिनिधियों ने व्यवसायों से पहले से संपर्क नहीं किया था ताकि उन्हें सचेत किया जा सके कि उनके रोबोट से स्वचालित कॉल हो सकती हैं।
अब बात यह है कि हमें नहीं लगता कि इन डेमो वीडियो को संपादित करना पूरी तरह से अनुचित है। बहुत सारे ब्रांड ऐसा करते हैं और Google भी ऐसा करता रहा है। हम समझते हैं कि व्यावहारिक डेमो के लिए उत्साह और रुचि पैदा करने की आवश्यकता होती है और यह अत्यधिक लंबा नहीं हो सकता। संपादन निश्चित रूप से आवश्यक हैं. हालाँकि, Google को जो सही नहीं लगा वह अस्वीकरणों की कमी थी। जेमिनी एआई संभवतः भविष्य में क्या कर सकता है, इसके बारे में "प्रेरणादायक डेवलपर्स" के हित में, Google ने यह आभास दिया कि वीडियो वास्तविक समय का था और एलएलएम में अभी वीडियो में दिखाई गई सभी चीजें करने की क्षमता है।